] 二 关 站 
http://www.arocmag.com/article/02-2019-03-008.html 计算 机 应 用 研究 


基于 深度 学 习 的 大 蒜 鳞 芽 朝 向 识别 研究 
方 ” 春 '， 和 孙 福 振 ， 任 崇 广 


(山东 理工 大 学 计算 机 科学 与 技术 学 院 ， 山 东 淄博 255049) 


摘 要 : 针对 目前 大 蒜 自动 播 种 机 难于 解决 直立 播种 的 问题 ， 而 已 有 钱 芽 朝向 识别 算法 过 于 复杂 ， 提 出 了 基于 深度 学 

习 的 方法 来 解决 大 蒜 鳞 芽 朝 向 识别 问题 。 该 方法 不 用 特意 提取 其 准 的 轮廓 特征 ， 也 不 用 计算 蒜 尖 和 质心 位 置 ， 而 是 直 

接 将 蒜 闪 图 像 作为 输入 ， 模 型 自行 抽取 图 像 特 征 ， 隐 式 地 从 训练 数据 中 进行 学 习 来 自动 识别 大 藉 鳞 芽 朝 向 。 实 验 结果 

表明 ， 当 使 用 1 700 张 蒜 闪 图 片 作为 训练 集 时 ， 模 型 在 400 张 图 片 组 成 的 独立 测试 集 上 的 识别 准确 率 达 到 97.5%。 此 
方法 简单 、 高 效 、 可 靠 ， 为 大 藉 直 立 播 种 问题 提供 了 一 种 新 的 解决 方案 ， 同 时 也 可 以 用 于 农业 选 种 等 其 他 模式 识别 问 

题 上 。 
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Identifying bulbil direction of garlic based on deep learning 


Fang Chuni, Sun Funzhen, Ren Chongguang 
(School of Computer Science & Technology, Shandong University of Technology, Zibo Shandong 255049, China) 


Abstract: In order to solve the problem of upright sowing of garlic by machine, this paper proposed a novel method based on 
deep learning for identifying the bulbil direction of garlic. This method did not require extracting the contour of garlic, 
calculating the tip position nor finding the center of mass of garlic. Instead, it used the garlic images directly as input for the 
model. The model extracted the image features implicitly and trained the neural network to identify the garlic bulbil direction 
automatically. Experimental results show that this model reached an accuracy of 97.5% when 1 700 garlic pictures are used as 
the training set and another 400 garlic pictures are used as the test set, suggesting that our method is simple, efficient and reliable 
for solving garlic upright sowing problem. Furthermore, it can also be used for solving seed selection problems in agriculture. 


Key Words: algorithm; depth learning; bulbil direction of garlic; pattern recognition 


种 观测 窗 的 方法 来 识别 定位 菩 办 的 尖 角 位 置 ， 然 后 结合 质心 位 
置 计算 菏 为 偏 角 来 识别 鳞 芽 朝向 。 杨 清明 等 人 四 根据 东 办 形 状 
大 蘑 因 其 良好 的 食用 和 药 用 价值 受到 全 球 人 民 喜 爱 。 我 国 ”特点 对 忒 办 图 像 进行 转换 、 分 割 以 及 膨胀 等 操作 来 设计 办 尖 朝 
是 大 蘑 的 主要 生产 国 ， 大 薪 种 植 面积 约 为 1 100 万 亩 ， 产 量 约 向 的 识别 模型 。 以 上 方法 都 需要 先进 行 显示 的 特征 抽取 ， 如 提 
5 全 球 总 产量 的 3/40 叶 ， 而 目前 大 藉 的 种 植 基本 全 靠 和 人 工 ， 劳 。 取 蒜 办 的 轮廓 特征 、 计 算 菩 尖 和 质心 的 位 置 等 ， 并 且 需 要 进 和 
动 强力 大 、 效 率 低 、 用 工 成 本 高 ， 因 此 ， 迫 切 需要 研制 出 播种 寺 征 数据 重建 ， 这 些 方法 设计 复杂 并 且 效 果 也 不 太 理 想 。 
速度 快 、 株 距 均 匀 、 能 胜任 规模 化 自动 种 植 的 大 菩 播 种 机 。 因 近年 来 ， 图 像 处 理 技术 广泛 应 用 于 农业 领域 ， 比 如 ， 用 般 
为 菏 的 生长 是 围绕 薪 芽 的 周围 生长 的 ， 所 以 大 菏 播 种 时 候 ， 鳞 。” 感 图 像 统计 作物 的 种 植 面积 和 耕地 的 数据 信息 、 进 行 作物 间 杂 
芽 朝 上 对 大 苗 出 苗 、 蒋 曹 和 薪 头 生长 发 育 至 关 重 要 。 播 种 时 如 ”” 草 的 识别 、 估 计 作 物 病虫害 情况 、 进 行 农产品 成 熟 度 和 质量 鉴 
可 控制 菩 种 鳞 芽 朝 上 是 大 薪 播 种 机 研究 的 关键 问题 申 。 定 、 果 实 和 种 子 的 外 观 分 类 等 9 外。 随 着 人 工 智 能 的 热潮 ， 深 
郭 英 芳 等 人 多 通过 边缘 检测 算法 对 薪 斩 的 形状 特征 进行 提 ” 度 学 习 受 到 了 高 度 关 注 。 深 度 学 习 中 的 卷 积 神经 网 络 
取 , 并 把 SUSAN 角 点 检测 算法 外 运用 到 汶 尖 识别 中 。 但 该 方法 (convolutional neural networks, CNN) 更 是 在 图 像 识 别 领 域 表 现 
只 能 找 出 忒 尖 位 置 ， 无 法 确切 判断 鳞 芽 具体 朝向 ， 并 且 当 菏 上 出 强劲 的 优势 器 。 CNN 可 以 直接 接收 原始 图 像 作为 输入 , 通 
有 和 菏 办 尖 角 类 似 的 尖锐 突起 时 ， 该 算法 就 不 能 准确 识别 办 尖 ”过 结构 重组 和 减少 权 值 将 特征 抽取 功能 融合 进 多 层 感知 器 ， 省 
的 位 置 。 吴 献 等 人 [$7 对 菩 办 样本 图 像 进行 形态 学 处 理 , 采用 略 传 统 识 别 算法 中 复杂 的 特征 提取 和 数据 重建 过 程 ， 而 隐 式 地 
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从 训练 数据 中 自行 抽取 图 像 特征 ， 包 括 颜 色 、 纹 理 、 形 状 及 图 
像 的 拓扑 结构 等 。 CNN 在 处 理 二 维 图 像 问题 上 , 特别 是 识别 位 
移 、 缩 放 及 其 他 形式 扭曲 不 变性 的 应 用 上 具有 良好 的 鲁 棒 性 和 
运算 效率 ， 它 可 处 理 环境 信息 复杂 、 背 景 知识 不 清楚 、 推 理 规 
则 不 明确 情况 下 的 问题 ， 自 适应 性 能 力 强 。 

由 于 大 忒 鳞 芽 朝向 识别 很 大 程度 上 依赖 于 大 未 轮廓 特征 
忒 办 图 像 中 局 部 的 像素 联系 较为 紧密 ， 距 离 较 远 的 像素 相关 性 
则 较 弱 ， 所 以 判定 蒜 尖 位 置 和 鳞 芽 朝向 时 ， 没 有 必要 对 全 局 图 
像 进行 感知 ， 只 需要 对 局 部 特点 进行 感知 ， 然 后 在 更 高 层 将 局 
部 的 信息 综合 起 来 就 得 到 了 全 局 的 信息 ,而 深度 学 习 中 的 CNN 
正 是 基于 这 样 的 “局 部 感知 ”的 思想 ， 在 图 片 中 物体 轮廓 的 识 
别 上 具有 天 然 的 优势 。 

本 文 以 蒜瓣 图 像 为 研究 对 象 ， 采 用 基 CNN 的 深度 学 习 方 
法 ,利用 Python 语言 和 Keras 深度 学 习 框 架 来 编程 实现 计算 机 
自动 识别 茵 辩 的 鳞 芽 朝向 ， 以 帮助 大 菩 播 种 机 器 实现 自动 判别 
鳞 芽 朝向 是 否 符 合 种 植 要 求 。 


1 ”材料 与 方法 


1.1 图 像 的 采集 

本 文 对 10 kg 大 蒜 进 行 藉 准 分离, 随机 选取 横 径 大 的 ( 宽 >20 
mm) 获 流 , 共 2 100 粒 作 为 样本 ,以 保证 每 张 样 本 图 片 都 不 同 。 实 
验 时 , 在 背景 的 选择 上 ,借鉴 前 人 的 结论 外 ,选用 黑色 和 深 色 毛 
面 底板 效果 比较 好 。 本 文采 用 一 个 深蓝 色 木 板 固定 在 水 平面 上 
作为 背景 来 放置 薪 种 颗粒 。 在 图 像 采 集 过 程 中 , 薪 办 放置 于 木板 
上 ,相机 镜头 伸展 方向 与 木板 垂直 ， 应 用 尼康 Coolpix A10 数码 
相机 采集 符合 种 植 要求 的 薪 种 图 像 ( 鳞 芽 朝 上 ) 1 050 张 和 不 符 
合 种 植 要 求 的 忒 种 图 像 〈 鳞 芽 非 彰 上 ) 1 050 张 。 由 于 数码 相机 
照片 的 输出 的 图 片 过 大 ,而 本 文 仅 是 模拟 实验 环境 ,为 了 方便 计 
算 和 处 理 ， 本 文采 用 美 图 秀 秀 批 处 理 软 件 在 不 改变 原 有 图 像 尺 
寸 比例 的 情况 下 ， 对 所 有 图 像 进行 缩放 转换 ， 转 换 后 的 图 片 大 
小 统一 为 150*150 像素 , 图像 输 出 格式 仍然 为 原来 的 卫 G 格式 ， 
采集 的 藉 种 图 像 如 图 1 所 示 。 
1.2 训练 集 与 测试 集 
本 实验 选取 了 鳞 芽 朝 上 和 鳞 芽 朝向 随机 的 图 像 各 850 张 合 
在 一 起 组 成 训练 集 Training 1 700; 剩 下 的 鳞 芽 朝 上 和 鳞 芽 随 
机 的 图 片 共 400 张 放 在 一 起 作为 测试 集 Testing 400。 因 为 所 有 
图 片 分 别 来 自 不 同 的 菩 办 颗粒 ， 所 以 没有 两 张 图 片 是 相同 的 ， 
这 有 利于 抑制 过 拟 合 问题 ,使 得 分 类 模型 具有 更 好 的 泛 化 能 
1.3” 卷 积 神经 网 络 结构 

鳞 芽 朝向 识别 问题 的 本 质 是 图 像 二 分 类 ， 即 判别 图 像 中 的 
鳞 芽 朝向 是 否 为 符合 种 植 要求 的 朝向 。 卷 积 神经 网 络 作为 深度 
学 习 的 支柱 ， 被 设计 为 针对 “感知 ”问题 最 好 的 模型 之 一 ， 尤 
其 在 图 像 分 类 问题 上 ,即使 图 片 很 少 ,也 能 把 特征 学 习 的 很 好 ， 
不 需要 任何 手工 的 特征 工程 ， 因 而 是 处 理 图 像 分 类 问题 的 利 
器 。CNN 遵循 从 低 阶 特征 到 高 阶 特征 的 信息 处 理 模 式 ， 即 第 一 
层 的 卷 积 核 用 来 检测 图 形 中 的 边 、 角 、 曲 线 等 特征 ， 第 二 层 的 


卷 积 核 用 来 检测 边 圆 、 封 闭 线 等 轮廓 特征 .….. 随 着 卷 积 层 的 增 
加 ， 逐渐 检测 出 更 复杂 的 特征 ， 而 大 藉 鳞 芽 朝 向 识别 问题 在 很 
大 程度 上 依赖 于 燕 办 的 轮廓 这 种 浅 层 特征 ， 所 以 CNN 天 然 就 
适用 于 鳞 芽 朝向 识别 问题 。 本 文 在 考察 了 一 些 常见 的 CNN 模 
型 后 发 现 ， 即 使 采用 较为 简单 的 卷 积 层 和 池 化 层 组 合 , CNN 也 
能 较 好 地 提取 大 蒜 的 轮廓 特征 ,获得 较 高 的 识别 准确 率 。 


| 


(b) 鳞 芽 朝 向 随机 的 未 种 图 
图 1 采集 的 薪 种 图 像 


在 CNN 的 卷 积 计算 中 , 目前 被 广泛 使 用 的 卷 积 核 大 小 是 3 
X3、5X5 或 者 7X7。 由 于 本 实验 所 使 用 的 图 片 尺寸 不 大 ， 所 
以 采用 了 3X3 的 卷 积 核 。 为 了 验证 网 络 深度 对 模型 性 能 的 影 
响 , 本 文 在 Training_1 700 的 数据 集 上 , 采用 五 交叉 验证 方法 ， 
对 比分 析 了 分 别 采用 1 一 4 个 卷 积 层 〈 每 个 卷 积 层 连接 一 个 池 
化 层 ) 的 模型 性 能 。 采 用 不 同 卷 积 层 数 的 模型 在 1 一 50 次 epoch 
下 的 精确 度 分 布 如 图 2 所 示 , 相 应 的 损失 函数 lose 的 分 布 如 图 3 
所 示 。 从 图 2 和 3 中 可 以 看 出 ， 四 个 模型 在 大 菏 鳞 芽 朝 向 识别 
问题 上 均 能 取得 较 好 的 效果 ; 其 中 , 3 层 (绿色 线 ) 和 4 层 ( 紫 
色 线 ) 模型 的 识别 精确 度 acc 比 1 层 〈 蓝 色 线 ) 和 2 层 (红色 
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线 ) 模型 的 acc 要 高 ， 而 相应 的 loss 则 更 低 ， 说 明 增 加 神经 网 


络 的 深度 有 利于 提升 模型 的 性 能 。 


1.00 荆 


不 同 卷 积 层 数 时 ,acc 与 epoch 的 关系 


-一 1_layer 
-一 2_layers 
-一 3_layers 
-一 4_layers 


1 6 11 16 21 


26 
epoch 


图 2 


不 同 卷 积 层 数 的 模型 的 精确 度 分 布 


…” 川 不 同 卷 积 层 数 时 ,loss 与 epoch 的 关系 
Ss —1 layer 
—2_layers 
0.5 
—3_layers 
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no 
nn 
[oe] 
一 0.3 
0.2 
0.1 
0 + + + + + + + + + 1 
1 6 11 16 21 26 31 36 41 46 
epoch 
图 3 不 同 卷 积 层 数 的 模型 的 loss 分 布 
本 文中 ， 采 用 四 个 卷 积 层 的 模型 相 比 于 采用 三 个 卷 积 层 的 


模型 的 优势 不 太 明 显 ， 为 了 控制 网 络 复杂 度 ， 最 后 及 月 


月 如 图 4 


所 示 的 CNN 结构 来 处 理 大 藉 鳞 芽 朝 向 的 识别 问题 。 该 模型 包 
含 三 个 卷 积 层 夹 着 三 个 池 化 层 ,再 接 上 两 个 全 连接 层 。 为 了 防止 


过 拟 , 在 两 个 全 连接 层 中 间 插 入 一 个 Dopout 层 , 该 层 和 


0.5， 即 以 概率 0.5 关闭 神经 元 来 防止 过 拟 合 。 除 了 最 后 一 个 全 


的 参数 为 


连接 层 的 激活 函数 为 “Sigmoid” 外， 
选用 “Relu”。 因 为 是 二 分 类 问题 ， 


式 余 各 层 的 激活 函数 为 均 
所 以 模型 选择 


“Binary_crossentropy” 作 为 损失 函数 ， 优 化 函数 则 采 / 


能 够 自 


动 调节 学 习 速 率 的 “RMSProp”。 


2 ”结果 与 分 析 


2.1 模型 精确 度 、 损 失 函 数 lose 与 训练 次 数 epoch 的 关系 
深度 学 习 中 ， 一 次 epoch 的 过 程 为 所 有 训练 样本 完成 一 次 


Forward 以 及 一 次 Backward 运算 


更 新 参数 的 过 程 。Epoch 次 


数 与 模型 识别 精确 度 的 关系 如 图 5 所 示 ， 相 对 应 的 模型 损失 函 
数 loss 与 epoch 次 数 的 关系 如 图 6 所 示 。 当 epoch 次 数 大 于 35 
时 ， 模 型 在 训练 集 与 测试 集 上 的 识别 精确 度 都 趋 于 稳定 ， 在 测 
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鳞 芽 朝向 识别 上 能 取得 不 错 的 效果 。 
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conv2d_1: Conv2D 
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activation_1: Activation 
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input: | (None, 64) 


dropout_1: Dropout 
pom PD (None., 64) 


dense_2: Dense 


wation 5. Activati | input: | (None, 1) 
activation_5: Activation Er 
output: | (None, 1) 


4 ” 卷 积 神经 网 络 结构 


对 


集 Test 400 上 的 准确 率 为 95.5% 一 97.5%， 其 对 应 的 损失 函 
数值 也 平稳 下 降 到 0.076 一 0.130 之 间 ， 说 明 该 深度 学 习 模 型 在 
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图 6 模型 损失 函数 lose 与 epoch 数 分 布 


2.2 训练 集 大 小 对 模型 性 能 的 影响 


深度 学 习 


集 上 能 取得 更 好 的 效果 。 为 了 验证 这 点 ， 本 文采 用 了 不 同 的 样 
本 数 来 训练 模型 ， 并 分 别 在 同一 个 测试 集 test_400 上 进行 了 验 
证 。 当 训练 样本 数 分 别 为 100、300、500、700、900、1 100、 


和 其 他 非 线性 机 器 学 习 模型 一 样 ， 往 往 在 大 数据 


1300、1 500 和 1700 张 图 片 时 ， 模 型 在 1 一 50 epoch 下 的 精确 


度 分 布 如 图 7 
看 出 ， 随 着 训 


所 示 , 相 应 的 损失 函数 lose 分 布 如 图 8 所 示 。 可 以 
练 样本 数 的 增加 ， 模 型 的 识别 精确 度 也 在 不 断 提 


升 (从 0.5 左右 提升 至 0.97)。 模 型 损失 函数 在 100 一 900 个 训 


练 样本 的 情况 下 跳 越 幅度 较 大 ， 而 在 1 100 一 1 700 个 训练 样本 
的 情况 下 处 于 稳定 下 降 的 状态 .图 $ 与 6 说 明 训 练 样本 数 越 多 ， 
模型 性 能 越 稳定 、 精 确 度 越 高 。 

表 1 统计 了 当 epoch 次 数 为 21 一 50 间 时 , 不 同 训练 样本 数 


加 至 数 万 张 图 


下 ， 模 型 在 验证 集 上 的 最 大 、 平 均 和 最 小 识别 精确 度 。 由 于 客 
观 实验 条 件 限 制 ， 本 研究 最 终 只 用 了 1 700 个 训练 样本 ， 但 模 
型 识别 精确 度 达 到 了 97.5%。 在 实际 应 用 中 ， 可 以 将 训练 集 增 


片 ， 这 样 有 助 于 进一步 提升 模型 的 性 能 。 


oy 
ou 
[4 
" 
> 


一 -100.s 一 -300.5 一 -500s 
e700 s 一 900.s 一 1100 : 


一 1300 s 一 一 1500 s 一 -1700 : 


不 同 训练 样本 数 时 val loss 与 epoch 的 关系 


n 
n 
a 
5 
> 


图 8 训练 样本 数 不 同 时 模型 的 损失 函 


表 1 训练 样本 数 不 同 时 ,模型 在 21 一 50 次 
最 大 、 平 均 和 最 小 精确 度 


图 7 训练 样本 数 不 同 时 模型 的 精确 度 分 布 


数 分 布 


epoch 中 的 


训练 集 样本 数量 


100s 300s 500s 700s 900s 1100s 1300s 1500s 1700s 


最 大 val acc 0.740 0.895 0.883 0.878 0.905 0.948 0.955 0.968 0.975 
平均 val acc 0.668 0.832 0.839 0.823 0.877 0.923 0.934 0.943 0.959 


最 小 val acc 0.500 0.715 0.558 0.700 0.790 0.878 0.913 0.888 0.932 


3 ”结束 语 


本 文 利用 CNN 的 “局 部 感知 ”特点 在 处 理 图 片 中 物体 轮廓 


识别 上 的 天 然 优 势 ， 提 出 了 基于 深度 学 习 的 大 藉 鳞 芽 朝 向 的 识 
别 算法 。 通 过 在 1 700 张 菩 办 图 片上 进行 训练 ， 在 另外 400 张 
苏 办 图 片 组 成 的 测试 集 上 进行 验证 ， 模 型 识别 准确 率 达 到 
97.5%, 为 大 藉 直 立 播种 问题 提供 了 一 种 新 的 解决 方案 。 与 传统 


算法 相 比 ， 本 文 所 提出 的 方法 具有 以 下 优点 : 


a) 本 算法 不 需要 单独 提取 东兴 的 轮廓 特 生 
心 的 位 置 ,避免 了 传统 算法 中 复杂 的 特征 提取 


b) 本 算法 简单 、 高 效 、 可 靠 , 在 经 过 30 一 50 次 epochs 训练 
后 ， 模 型 性 能 达到 稳定 状态 ， 识 别 精 确 率 在 97% 以 上 ， 并 且 样 


上 ， 计算 薪 尖 、 质 
和 数据 重建 过 程 。 
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本 数 越 多 越 有 利于 识别 精确 度 的 提高 。 


0) 该 算法 通用 性 强 ， 稍 作 改 动 即 可 扩展 应 用 到 作物 选 种 、 


果实 外 形 质量 鉴定 等 其 他 类 似 的 模式 识别 问题 上 ， 具 有 较 广泛 

的 应 用 。 
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